~ 就跟跑步游泳一樣,你做啥他做啥 ~
假設我們在 Day 17 已經取得市場報價資料並存放在 S3 Bucket 裡面(Bucket Name: algotrading-2023-09)
先執行以下指令建立環境:
$ aws cloudformation create-stack \
--stack-name algorithmic-trading \
--template-body file://Day26/cloudformation.yaml \
--capabilities CAPABILITY_IAM
進入 SageMaker 中,Notebook Instances -> algorithimic-XXX -> Open Jupyter
-> 開啟 Day26/Load_History_Data.ipynb
最主要處理資料的程式碼如下:
import pandas as pd
df = pd.read_csv("daily_adjusted_"+sym+".csv",infer_datetime_format=True, parse_dates=['timestamp'], index_col=['timestamp'])
del df["split_coefficient"]
del df["dividend_amount"]
del df["adjusted_close"]
df.rename(inplace=True,columns={'volume':'vol'})
df.index=df.index.rename('dt')
df['sym']=sym
df = df[['sym', 'open', 'high', 'low', 'close','vol']]
df.sort_index(inplace=True)
df.head()
程式碼的主要目的是讀取CSV文件,並進行一系列的數據處理操作,包括刪除不需要的列、重命名列、新增列以及對列的重新排序,最終將處理後的數據存儲在Pandas DataFrame中。這樣的數據預處理通常是為了將數據準備好以供後續的分析或建模使用。
最後記得清理資源:
$ aws cloudformation delete-stack --stack-name algorithmic-trading